文章目录
  1. 1. 如何提高mysql load data infile的速度
  2. 2. 如何load数据里面带反斜杠(backslash)””的数据
  3. 3. 如何load不同编码的数据
  4. 4. 如何load的时候只insert特定的列

如何提高mysql load data infile的速度

测试数据2.5G,共有数据9427567条。用的mysql的large服务器的配置。load一次需要大概10分钟左右。建的表用的是MYISAM,调整了几个session的参数值

1
2
SET SESSION BULK_INSERT_BUFFER_SIZE=256217728;
SET SESSION MYISAM_SORT_BUFFER_SIZE=256217728;

运行结果如下:

Query OK, 9427567 rows affected, 1558 warnings (3 min 55.21 sec)
Records: 9427567 Deleted: 0 Skipped: 0 Warnings: 0

google到的还可以

1
2
set global KEY_BUFFER_SIZE=256217728;
alter table tablename disable keys;

如何load数据里面带反斜杠(backslash)””的数据

由于如果你没有指定FIELDS子句,则默认值为假设您写下如下语句时的值:

FIELDS TERMINATED BY ‘\t’ ENCLOSED BY ” ESCAPED BY ‘\’

所以,如果你的数据里面有反斜杠(backslash)””的时候,数据会出现被截断的问题。出现这种问题,只要写上如下的fields子句即可:

FIELDS TERMINATED BY ‘\t’ ENCLOSED BY ” ESCAPED BY ” 

如何load不同编码的数据

原来用的4.X的mysql,我是select INTO OUTFILE ,只后用iconv,或者其他软件来做。可以参考这里,但是由于这次数据大,用ultraedit等软件打开都要半天。好在新版的mysql可以增加一个新的参数:

CHARACTER SET gbk

我的文本数据是GBK的编码,数据表是utf8的,用这种方法测试成功。

如何load的时候只insert特定的列

比如表里面有比元数据多的列。可以在load的时候指定要插入的字段名字。

示例的代码如下:

1
2
3
4
5
6
LOAD DATA INFILE '~/data.txt'   
INTO TABLE fb0505
CHARACTER SET gbk
FIELDS TERMINATED BY '\t' ENCLOSED BY '' ESCAPED BY ''
LINES TERMINATED BY '\n' STARTING BY ''
(seller_id,fb_type,fb_date,item_url);

其中表fb0505里面还有一列是id。 :

Popularity: 20%

转自: http://www.juyimeng.com/mysql-load-data-infile.html

文章目录
  1. 1. 如何提高mysql load data infile的速度
  2. 2. 如何load数据里面带反斜杠(backslash)””的数据
  3. 3. 如何load不同编码的数据
  4. 4. 如何load的时候只insert特定的列